谷裕 | 个人信息 | 西安电子科技大学个人主页

学术信息网西电导航关于使用说明搜索系统首页登录控制面板收藏谷裕的留言板

基本信息

姓名：谷裕

职称：副教授

职位：研究生导师

工作单位：人工智能学院

招生信息

招生学院：人工智能学院

招生专业：计算机科学与技术，控制科学与技术，电子信息　

招生类型：硕士研究生

研究方向

1. 语音情感识别、语音合成

2. 大语言模型

3. 自然语言处理

联系方式

电子邮箱：guyu@xidian.edu.cn

办公地点：南校区网安大楼C-II-901

个人简介

谷裕，西安电子科技大学人工智能学院副教授、硕士生导师，博士毕业于荷兰蒂尔堡大学，主要研究方向为大语言模型、语音情感识别等自然语言处理技术领域。主持国家自然科学基金青年项目、陕西省面上项目、参与陕西省重点产业链项目、科技部产教融合项目。在国内外期刊和学术会议上合作发表论文三十余篇，其中第一/通信作者国际CCF会议 A 类发表论文3篇，B类发表10篇，SCI/EI收录十余篇。近年来在“人工智能+教育”、一流课程建设、混合式教学、产学研结合等领域做出积极探索与实践。主持、参与10余项教改项目，《最优化理论与方法》获批2022年校级一流本科课程；研究生课程《神经网络基础与应用》获批教育部与“学堂在线”全国MOOC慕课项目；《神经网络基础与应用》获批2022年校级教材。各类教学竞赛获奖二十余项，荣获2024年第八届全国高等学校电子信息类专业青年教师讲课竞赛全国二等奖、2022年和2021年全国高校混合式课堂创新大赛优胜奖、2020年陕西省第三届高校课堂教学创新大赛三等奖、青年教师教学竞赛二等奖2次、校级优质教学二等奖2次、校级课堂创新比赛二等奖3次、校级青年讲课比赛三等奖1次、校级课程思政三等奖1次。《自然语言处理》获批华为智能基座课程，荣获“华为先锋教师”称号、荣获华为智能基座奖教金。荣获西安电子科技大学“杭州研究院—达利集团”奖教金。

科研项目

团队主要专注于语音处理与自然语言处理两大方向，深入钻研，紧密追踪国际前沿发展动态，致力于有效解决行业中的复杂问题，推动技术进步与应用落地，在语音情感识别、语音合成、大语言模型、多模态知识表示学习等领域取得了显著进展和创新成果。

目前，研究团队正在开展的科研项目有：
· 基于大语言模型批注版的智能警务辅助办公问答系统
· 大语言模型辅助的语音克隆系统
· 虚假语音仿真生成系统
· 教育数字人（虚拟人）生成工具研发
· AIGC元宇宙内容自动生成系统
· 多模态知识统一表达与融合推理技术

科研成果（近五年）

[1] Chenyu Li, Yu Gu∗ , He Zhang, Linsong Liu, Haixiang Lin, Shuang Wang. Hybrid Contrastive Learning Decoupling Speech Emotion Recognition, IEEE International Conference on Acoustics, Speech, and Signal Processing, 2025. (CCF-B，语音顶会)

[2] Xu Xi; Yu Gu∗ , Chenyu Li, He Zhang, Haixiang Lin, Linsong Liu. TDMER: A Task-Driven Method for Multimodal
Emotion Recognition, IEEE International Conference on Acoustics, Speech, and Signal Processing, 2025. (CCF-B，语音顶会)

[3] Rui Yang, Shuang Wang, Yu Gu, Jihui Wang, Yingzhi Sun, Huan Zhang, Yu Liao, Licheng Jiao; Continual learning for cross-modal image-text retrieval based on domain-selective attention, Pattern Recognition, 2024. (SCI一区，影响因子8.0)

[4] Dou Quan, Huiyuan Wei, Shuang Wang, Yu Gu, Biao Hou, Licheng Jiao. A novel coarse-to-fine deep learning registration framework for multimodal remote sensing images, IEEE Transactions on Geoscience and Remote Sensing, 2024. (SCI一区，影响因子8.2)

[5] Yuanyuan Wang; Yu Gu∗ ; Yifei Yin ;Yingping Han; He Zhang; Shuang Wang; Chengyu Li. Dou Quan; Multimodal transformer augmented fusion for speech emotion recognition, Frontiers in Neurorobotics,2023. (SCI三区，影响因子3.493)

[6] Xiutiao Ye, Shuang Wang, Yu Gu, Jihui Wang, Ruixuan Wang, Biao Hou, Fausto Giunchiglia, Licheng Jiao. A joint-training two-stage method for remote sensing image captioning, IEEE Transactions on Geoscience and Remote Sensing, 2022. (SCI一区，影响因子8.2)

[7] Shuang Wang, Dong Zhao, Chi Zhang, Yuwei Guo, Qi Zang, Yu Gu, Yi Li, Licheng Jiao. Cluster alignment with target knowledge mining for unsupervised domain adaptation semantic segmentation, IEEE Transactions on Image Processing, 2022. (SCI一区，影响因子10.8)

[8] Ying Zhou; Xue feng Liang; Yu Gu*; Yifei Yin; Longshan Yao. Multi-Classifier Interactive Learning for Ambiguous Speech Emotion Recognition. IEEE/ACM Transactions on Audio, Speech and Language Processing, Volume: 30, page: 695 – 705, 2022.(SCI一区，影响因子4.364)

[9] Shuang Wang, XiutiaoYe, Yu Gu*, Jihui Wang, Yun Meng, Jingxian Tian, Biao Hou, Licheng Jiao. Multi-Label Semantic Feature Fusion for Remote Sensing Image Captioning. ISPRS Journal of Photogrammetry and Remote Sensing. Volume 184, Pages 1-18, February 2022. (SCI一区，影响因子11.774)

[10] Quan D, Wang S, Yu Gu, et al. “Deep feature correlation learning for multi-modal remote sensing image registration”, IEEE Transactions on Geoscience and Remote Sensing, 2022. (SCI一区，影响因子8.125)

[11] R Yang, S Wang, Y Sun, H Zhang, Y Liao, Yu Gu, B Hou, L Jiao. “Multimodal Fusion Remote Sensing Image–Audio Retrieval”, IEEE Journal of Selected Topics in Applied Earth Observations and Remote,2022. (SCI二区，影响因子4.715)

[12] Y Zhou, X Liang, X Zhang, Z Liang, C Wang, Yu Gu, Y Yin, “A Joint Framework for Mining Discriminative and Frequent Visual Representation”, Neurocomputing,2022. (SCI二区，影响因子5.779)

[13] Yifei Yin, Yu Gu*, et al. Progressive Co-teaching for Ambiguous Speech Emotion Recognition. 2021 IEEE International Conference on Acoustics, Speech and Signal Processing. (ICASSP 2021). Toronto, Ontario, Canada. 2021.(CCF-B，语音顶会)

[14] Rui Yang, Yu Gu* et al. Cross-Modal Feature Fusion Retrieval for Remote Sensing Image-Voice Retrieval. 2021 IEEE International Geoscience and Remote Sensing Symposium. (IGARSS 2021). Brussels, Belgium. 2021.

[15] Yun Meng, Yu Gu*,et al. Multi-View Attention Network for Remote Sensing Image Captioning. 2021 IEEE International Geoscience and Remote Sensing Symposium. (IGARSS 2021). Brussels, Belgium. 2021.

[16] Shuang Wang*, Yun Meng, Yu Gu*, Lei Zhang, Xiutiao Ye, Jingxian Tian, Licheng Jiao. Cascade Attention Fusion for Fine-grained Image Captioning based on Multi-layer LSTM. 2021 IEEE International Conference on Acoustics, Speech and Signal Processing. (ICASSP 2021). Toronto, Ontario, Canada, 2021.

[17] Wang Qian nan; Zhou Ying; Zhu Zhaoyan; Liang Xuefeng; Yu GU; Jointly Discriminating and Frequent Visual Representation Mining, 15th Asian Conference on Computer Vision (ACCV2020),Kyoto, Japan, 2020.

招生需求

招生学院：人工智能学院

招生专业：计算机科学与技术，电子信息-人工智能、电子信息-计算机技术

招生年份：2025

招生类型：硕士研究生招生

如果你对语音处理、大语言模型、自然语言处理领域充满热情，有兴趣和我一起玩转学术，欢迎加入我们的团队！

请将简历发送至邮箱：guyu@xidian.edu.cn

课题组学生

在读硕士：

刘涛（2027届，2024入学。）

朱方羽（2027届，2024入学。）

安德权（2027届，2024入学。）

刘林松（2026届，2023入学。）

李晨雨（2025届，2022入学。ICASSP×2录用，去向：航天九院研发中心）

在读留学生：

Muhammad Salman Shahid，Chilato Musiba Chilato，Atif Hussain

已指导硕士：

尹义飞（2022届。ICASSP×1录用，IEEE TASLP×1录用。去向：深圳大学实验室教师）

韩迎萍（2023届。去向：王爽教授团队读博）

王媛媛（2024届。Frontiers in Neurorobotics×1录用。去向：甘肃省大数据中心）

未经西安电子科技大学以及个人主页教师本人许可，不得复制、转载和传播本页内容，禁止用于任何商业用途。如需转载请征得主页所有者同意，并附上主页链接！

更新

谷裕的留言板